\documentclass{sig-alternate}
\usepackage{graphicx}
\usepackage{chngcntr}
%\usepackage{float}

%\counterwithin{figure}{section}
%\counterwithin{table}{section}
%\counterwithin{equation}{section}


\begin{document}


\title{Trabajo Pr\'actico Final}
\numberofauthors{5} 
\author{
% 1st. author
\alignauthor
Cura, Mar\'ia Eugenia\\
       \affaddr{Instituto Tecnol\'ogico de Buenos Aires}\\
       \affaddr{Buenos Aires, Argentina}\\
       \email{mcura@alu.itba.edu.ar}
% 2nd. author
\alignauthor
Goldberg, Daniel \\
       \affaddr{Instituto Tecnol\'ogico de Buenos Aires}\\
       \affaddr{Buenos Aires, Argentina}\\
       \email{dgoldber@alu.itba.edu.ar}
% 3rd. author
\alignauthor Neururer, Martin\\
       \affaddr{Instituto Tecnol\'ogico de Buenos Aires}\\
       \affaddr{Buenos Aires, Argentina}\\
       \email{mneurure@alu.itba.edu.ar}
\and  % use '\and' if you need 'another row' of author names
% 4th. author
\alignauthor Nul, Diego\\
       \affaddr{Instituto Tecnol\'ogico de Buenos Aires}\\
       \affaddr{Buenos Aires, Argentina}\\
       \email{dnul@alu.itba.edu.ar}
% 5th. author
\alignauthor Rezzano, Sebastian\\
       \affaddr{Instituto Tecnol\'ogico de Buenos Aires}\\
       \affaddr{Buenos Aires, Argentina}\\
       \email{srezzano@alu.itba.edu.ar}
}

\maketitle

\section*{Introducci\'on}
La din\'amica del proceso de renovaci\'on de licencias de conducir se compone de varios eventos que el solicitante realiza para poder obtener su nueva documentaci\'on. Los mismos se detallan a continuaci\'on.
\begin{itemize}
\item Los ciudadanos ingresan por la Entrada/Salida y se dirigen a la estaci\'on de recepci\'on R.
\item Esta estaci\'on entrega un formulario para los interesados en la renovaci\'on y comprueba la documentaci\'on, en caso de que efectivamente realicen el tr\'amite.
\item Una vez pasada la estaci\'on R, se dirigen a E1 y forman fila. All\'i entregan el registro viejo y se le entrega un formulario, donde deben llenar sus datos y un n\'umero de orden. Una vez entregado el formulario se los llama por n\'umero al mostrador E3. Mientras no alcancen a llenar el formulario, ser\'an desplazados un lugar en la cola de la facilidad E3.
\item Luego pasan a la estacion OFT, y les hacen un examen oftalmol\'ogico.
\item Al finalizar el examen oftalmol\'ogico, si el registro a renovar es profesional o la persona tiene mas de 70 a\~nos pasan por un examen psico-fisico en la estacion PSF.
\item Los que no aprueban alguno de estos dos test pasan a retirar su licencia vieja por E1 y salen del sistema. Los que aprueban se dirijen a E2 donde entregan los vales de aptitud y se les entrega un recibo para abonar en cualquiera de las 3 cajas, C1, C2 o C3.
\item Por el n\'umero de recibo pagado se retira el nuevo registro en la estaci\'on E2 y sale del sistema.
\item La oficina comienza a atender a las $8:00$hs y recibe clientes hasta las $13:00$hs.
\end{itemize}

El modelo del sistema se puede ver en la Figura \ref{fig:sysmodel}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/system_model2.pdf}
 	\caption{\protect\small Modelo del sistema}
 	\label{fig:sysmodel}
\end{figure}


\section*{Parte A}
\textbf{Modelar el intervalo de tiempo entre arribos, a partir de los datos medidos del archivo
llegadas registro y modelar el intervalo de tiempo de atenci\'on de la estaci\'on E3 con los
datos del archivo e3registro. Para ello hacer estad\'istica descriptiva, justificando el n\'umero
de intervalo de clases y realizar los test pertinentes.}\\
Realizamos estad\'istica descriptiva para modelar el intervalo de tiempo entre arribos 
y el intervalo de tiempo de atenci\'on de la estaci\'on E3 utilizando la colecci\'on 
de datos de tiempos de arribos y de atenci\'on dada. Sobre esta colecci\'on realizamos:  
\begin{itemize}
 \item Histograma (para mostrar la distribuci\'on de frecuencia (densidad) de los datos)
 \item Tests estad\'isticos de hip\'otesis ($\chi^2$, KS y Q-Q)
\end{itemize}

% note: --> the Chi-square distribution function is a exponential function with n grades degrees of freedom for error (n = 1, 2, 3, ...).
% We are comparing the histogram against the probabilistic distribution function (PDF) not an exponential function.

\subsection{Tiempo entre arribos al sistema}
Al analizar el histograma de la figura \ref{fig:histarrival2}, podemos ver que la distribuci\'on 
de frecuencias del tiempo entre arribos se comporta como una funci\'on exponencial.  
Para verificar esto realizamos un test de $\chi^2$. Dado el tama\~no muestral, utilizamos $7$ clases con las cuales construimos el histograma de la Figura \ref{fig:histarrival2}.
Existen varios m\'etodos para calcular la \textit{correcta} cantidad de intervalos de clases \cite{Hyn1995}:
\begin{itemize}
 \item F\'ormula de Sturges %(1926)
 \item Regla de Scott %(1979)
 \item Regla de Freedman-Diaconis %(1981)
 \item Regla de Nu\~nez.
 
\end{itemize}

Lo que sucede es que en la mayor\'ia de los casos no existe una cantidad \textit{ideal} de clases que ilustren los datos y sus propiedades. Generalmente hacen una aproximaci\'on a la forma de la distribuci\'on y no todas las reglas funcionan correctamente con grandes cantidades de datos. Por ejemplo, la regla de Sturges no tiene en cuenta la variabilidad estad\'istica y solo d\'a buenos resultados para peque\~nos sets de datos ($\leq 200$). En la mayor\'ia de los casos, el n\'umero de clases se elige experimentalmente. 

Para aproximar el tama\~no de clases utilizamos la regla de Scott \cite{Sco1979},
\begin{equation}
 h_n = 3.49\sigma n^{-1/3}
\end{equation}
donde $n$ es el tama\~no y $\sigma$ el desv\'io est\'andar de la muestra. Con $n=200$ obtenemos un valor de $\lfloor 10.8537 \rfloor = 10$ clases. 
Luego de varios experimentos concluimos que 7 clases son suficientes para ilustrar el histograma del modelo. Una cantidad mayor de clases 
son solo \'utiles para detectar estructuras bimodales, aumentando el riesgo de 
distorsionar el desv\'io.


Al realizar el test de $\chi^2$ obtenemos una media $\lambda = 18.8253$ [clientes/hora] y 
un est\'adistico de $\chi^2_0 = 10.7092$. 
Al comparar este valor con el valor cr\'itico para $5$ grados de libertad 
y un nivel de significaci\'on del $\%5$, el cual resulta $\chi^2_{(5,0.05)}=11.0705$, 
concluimos que no se puede afirmar que los datos no provengan de una distribuci\'on exponencial.
Realizamos un plot Q-Q obteniendo el gr\'afico de la 
Figura \ref{fig:qq2}. Podemos apreciar, comparando con la funci\'on 
identidad graficada tambi\'en en la Figura \ref{fig:qq2}, que los cuantiles del 
plot Q-Q tienden a acomodarse sobre la identidad. Esto sucede en mayor 
densidad para los valores chicos. Analizando esto concluimos nuevamente 
que la distribuci\'on de los datos de la muestra tienden a una distribuci\'on exponencial.


El test de uniformidad de Kolmogorov-Smirnov es otro m\'etodo estad\'istico que se utiliza para analizar dos distribuciones de probabilidad y compararlas. El KS-Test tiene la ventaja de ser un m\'etodo no param\'etrico y con libre distribuci\'on. Esto quiere decir, que no asume hip\'otesis sobre la distribuci\'on de probabilidad de los datos. Adem\'as, este m\'etodo es mas robusto que el $\chi^2$ ya que compara la distancia de la funci\'on de distribuci\'on emp\'irica de los datos y la funci\'on de distribuci\'on te\'orica. Aplicando el test obtenemos resultados satisfactorios acerca de nuestra hip\'otesis sobre la distribuci\'on de los datos.
El diagrama ilustra el test de hip\'otesis entre una distribuci\'on $\mathbb{P}$ y una distribuci\'on particular $\mathbb{P}_0$ de la siguiente manera:
$$\mathcal{H}_0:\mathbb{P} = \mathbb{P}_0,\quad \mathcal{H}_1:\mathbb{P} \neq \mathbb{P}_0.$$


%Aplicando tambi\'en el KS-Test podemos ver en la figura \ref{fig:ksstat2} que la distribuci\'on exponencial $\mathcal{N}(\mu, \sigma^2)$ encaja en la distribuci\'on de la muestra de forma correcta.
%Para el test estad\'istico con un nivel de significaci\'on $\alpha = 0.05$ la m\'axima distancia se da en $D = 0.047516$ y el valor cr\'itico en $D_{0.05} = 0.095159$.
%Como $D < D_{\alpha}$ la hip\'otesis $\mathcal{H}_0$ es aceptada.
%FALTA PONER LOS DATOS DEL TEST KS PARA LOS VALORES DE registro Y DECIR QUE DA BIEN (ESOS DATOS NO LOS TENGO NI TAMPOCO EL GRAFICO). VER QUE 
%DICE MATHCAL N OSEA DE NORMAL, ESO HAY QUE PASARLO A EXPONENCIAL CON LOS VALORES. TODO ESTO NO LO TENGO AHORA! HAY QUE PEDIRLE A MARTIN.

%----

%GRAFICOS DE REGISTRO (ESTA DISTRIBUCION ES EXPONENCIAL, MIRAR LOS GRAFICOS Y QUE CORRESPONDA)
%ESTOS GRAFICOS NO ESTAN EN EL REPOSITORIO, HABRIA QUE PREGUNTARLE A MARTIN SI ESTAN HECHOS! SINO ESTAMOS AL HORNO.
%FIJARSE QUE EN EL TEXTO HABLA DE 2 HISTROGRAMAS DIFERENTES, ADEMAS DE QUE NO ESTAN VER BIEN CUAL ES CUAL!



\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/histogram_exp.pdf}
 	\caption{\protect\small Histograma de tiempos entre llegadas al registro}
 	\label{fig:histarrival2}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/QQ_plot_exp.pdf}
 	\caption{\protect\small Test QQ}
 	\label{fig:qq2}
\end{figure}


\subsection{Tiempo de atenci\'on de la estaci\'on E3}
Para este caso tambi\'en realizamos un histograma (Figura \ref{fig:histarrival}) con los datos de la muestra. 
A partir de \'este apreciamos que la distribuci\'on para el tiempo de atenci\'on 
de la estaci\'on E3 tiende a una distribuci\'on normal. Dado el tama\~no muestral, 
utilizamos $7$ clases como vemos en la Figura \ref{fig:histarrival}. El n\'umero de clases lo elegimos 
de la misma forma que para el tiempo entre arribos al sistema.
Al realizar el test de $\chi^2$ obtenemos un estad\'istico $\chi^2_0 = 6.225752$. Comparando este valor con el valor 
cr\'itico para 4 grados de libertad (ya que utilizamos c\'alculos 
estad\'isticos adicionales(media y desv\'io est\'andar)), y un nivel 
de significaci\'on del $\%5$, resultando $\chi^2_{(4,0.05)}=9.490000$. 
Este hecho confirma nuestra hip\'otesis de que los datos provienen de una distribuci\'on normal. 
Para afirmarlo realizamos un plot Q-Q que mostramos en la Figura \ref{fig:qq}. Vemos aqu\'i que, nuevamente, al comparar con la funci\'on de identidad, los cuantiles se alinean sobre la misma, con mayor densidad para valores medios. Esto nos confirma nuestra hip\'otesis que los datos tienden a una distribuci\'on normal.

Aplicando tambi\'en el KS-Test podemos ver en la figura \ref{fig:ksstat} que la distribuci\'on normal $\mathcal{N}(\mu, \sigma^2)$ encaja en la distribuci\'on de la muestra de forma correcta.
Para el test estad\'istico con un nivel de significaci\'on $\alpha = 0.05$ la m\'axima distancia se da en $D = 0.047516$ y el valor cr\'itico en $D_{0.05} = 0.095159$.
Como $D < D_{\alpha}$ la hip\'otesis $\mathcal{H}_0$ es aceptada.

\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/histogram.pdf}
 	\caption{\protect\small Histograma de tiempos entre llegadas al registro}
 	\label{fig:histarrival}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/QQ_plot.pdf}
 	\caption{\protect\small Test QQ}
 	\label{fig:qq}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/ks_statistics.pdf}
 	\caption{\protect\small Diagrama de test KS. La flecha muestra la posici\'on de la distancia m\'axima $D$.}
 	\label{fig:ksstat}
\end{figure}


\section*{Parte B}
\textbf{ Indicar las variables de estado del sistema y el espacio de estados.}

El sistema cuenta con varias colas que son del tipo \textit{FIFO}. La \'unica que no cumple con esto es la de la estaci\'on E3 en la cual el cliente es desplazado un lugar si no ha terminado de llenar el formulario cuando le toca su turno. El sistema entonces, se modela como una red de colas.
Una posible representaci\'on de estados para el sistema podr\'ia ser el vector:
 
$X = ( x_R, x_{E1}, x_{E3}, x_{OFT}, x_{PSF}, x_{E2}, x_{C1}, x_{C2}, x_{C3}, $

$b_R, b_{E1}, b_{E3}, b_{OFT}, b_{PSF}, b_{E2}, b_{C1}, b_{C2}, b_{C3})$\\
Siendo $x_y$ la longitud de la cola $y$ y $b_z$ la ocupaci\'on de $z$.
 
El espacio de estado queda:
 
$S = \{ X  / x_R, x_{E1}, x_{E3}, x_{OFT}, x_{PSF}, x_{E2}, x_{C1}, x_{C2}, x_{C3}=0,1,..$
\textasciicircum $ b_R, b_{E1}, b_{E3}, b_{OFT}, b_{PSF}, b_{E2}, b_{C1}, b_{C2}, b_{C3} = 0,1\}$
 
 
\section*{Parte C} 
\textbf{Indicar los tipos de eventos y el espacio de eventos.}
Como al sistema lo podemos modelar como una red de colas, determinamos que el mismo tiene 2 tipos de eventos para cada cola: arribos y partidas. Entonces los tipos de eventos quedarian de la siguiente forma:
\begin{itemize}
 \item $R_a:$ Llegada de un cliente a Recepci\'on.
 \item $R_d:$ Partida de un cliente de Recepci\'on a E1.
 \item $E1E3_d:$ partida de un cliente de E1 a E3.
 \item $E1S_d:$ partida de un cliente del sistema.
\item $E3_d:$ partida de un cliente de E3 a OFT. 
\item $OFTPSF_d:$ partida de un cliente a OFT.
\item $OFTE2_d:$ partida de un cliente a E2.
\item $OFTE1_d:$ partida de un cliente a E1.
\item $PSFE2_d:$ partida de un cliente de PSF a E2.
\item $PSFE1_d:$ partida de un cliente de PSF a E1.
\item $C1_d:$ partida de un cliente de C1 a E2.
\item $C2_d:$ partida de un cliente de C2 a E2.
\item $C3_d:$ partida de un cliente de C3 a E2.
\item $E2C1_d:$ partida de un cliente de E2 a C1.
\item $E2C2_d:$ partida de un cliente de E2 a C2.
\item $E2C3_d:$ partida de un cliente de E2 a C3.
\item $E2_d:$ partida de un cliente del sistema.
\end{itemize}


\indent Entonces el espacio de eventos del sistema queda:
 
  $E = \{ R_a, R_d, E1E3_d, E1S_d, E3_d,  OFTPSF_d, OFTE2_d, \\
  OFTE1_d, PSFE2_d, PSFE1_d, C1_d, C2_d, C3_d, E2C1_d, E2C2_d,\\
   E2C3_d,  E2_d\}$
  
\indent Por ejemplo, para un cliente que llega y necesita renovar un registro profesional, pasando exitosamente todos los estados, la secuencia de eventos llevados a cabo quedar\'ia:
    $\{R_a, R_d, E1E3_d, E3_d, OFTPSF_d, PSFE2_d, E2C1_d, C1_d, E2_d\}$

\section*{Parte D}
\textbf{ Realizar una simulaci\'on indicando las condiciones iniciales, el tipo de generador 
usado y la semilla. Mostrar las gr\'aficas de las colas en cada estaci\'on.}\\

\textbf{Condiciones iniciales: }Todas las colas del sistema se encuentran vacias y las estaciones se encuentran disponibles
a las $8:00 am$ cuando comienza la simulaci\'on. El tiempo que tardan los clientes en llenar el formulario lo representamos con una variable aleatoria con distribuci\'on uniforme entre 1 y 2 minutos. 
Asumimos que el $90\%$ de la gente que se presenta en la recepci\'on realiza efectivamente la renovaci\'on de la licencia de conducir.
Adem\'as asumimos que el $5\%$ de la gente es mayor a 70 a\~nos, con lo que el porcentaje de personas que debe pasar por la estaci\'on de examen psicofisico es de aproximadamente $15\%$. Utilizamos la funcion \texttt{rand}, generador de n\'umeros pseudoaleatorios que provee el programa \texttt{GNU Octave}. La semilla que utilizamos para la simulaci\'on es un entero de valor arbitrario que fijamos en 10.

Los resultados obtenidos para cada cola se pueden ver en las figuras \ref{fig:qcajas} a \ref{fig:qreception}.
  

En estas figuras podemos observar que las personas se acumulan en la cola 
para ingresar a E2 llegando a un tope de 52 personas. 
Este n\'umero muestra un crecimiento lineal mientras entra gente al sistema 
y comienza a decrecer despu\'es de los 300 minutos, 
es decir, una vez que la oficina cierra sus puertas a nuevos arribos. 
En las otras cajas no se registraron demoras considerables. 

En esta simulaci\'on conclu\'imos que el punto critico del sistema se 
encuentra en E2 ya que es la cola que mayor cantidad de gente tiene 
durante la simulaci\'on.

\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_cajas.pdf}
 	\caption{\protect\small Longitud de la cola de cajas en funci\'on del tiempo 
	para una simulaci\'on}
 	\label{fig:qcajas}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_e1.pdf}
 	\caption{\protect\small Longitud de la cola de la estaci\'on E1 en funci\'on del tiempo 
	para una simulaci\'on}
 	\label{fig:qe1}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_e2.pdf}
 	\caption{\protect\small Longitud de la cola de la estaci\'on E2 en funci\'on del tiempo 
	para una simulaci\'on}
 	\label{fig:qe2}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_e3.pdf}
 	\caption{\protect\small Longitud de la cola de la estaci\'on E3 en funci\'on del tiempo 
	para una simulaci\'on}
 	\label{fig:qe3}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_oft.pdf}
 	\caption{\protect\small Longitud de la cola de la estaci\'on de 
	oftalmolog\'ia en funci\'on del tiempo para una simulaci\'on}
 	\label{fig:qoft}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_psf.pdf}
 	\caption{\protect\small Longitud de la cola de la estaci\'on de 
	examen psicof\'isico en funci\'on del tiempo para una simulaci\'on}
 	\label{fig:qpsf}
\end{figure}
\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/queue_reception.pdf}
 	\caption{\protect\small Longitud de la cola de la recepci\'on en 
	funci\'on del tiempo para una simulaci\'on}
 	\label{fig:qreception}
\end{figure}

\section*{Parte E}
\textbf{ Realizar 10 simulaciones independientes. Hallar el tiempo medio por cliente en el sistema,
suponiendo que las tres cajas C1, C2 y C3 est\'an operativas mostrar los resultados 
convenientemente en una tabla. Computar con estos resultados el estimador del tiempo medio por
cliente y su error.}	\\


El tiempo medio de cliente en el sistema para 10 simulaciones con un nivel de
significancia de $5\%$ es $258.472 \pm 16.9352$.
En la tabla \ref{table:tiempoMedio} se muestran los valores obtenidos
para las simulaciones correspondientes.

\begin{table}[ht]
\label{table:tiempoMedio}
\caption{\protect\small Tiempo medio del cliente en el sistema para 10 simulaciones}
\centering
\vskip 6pt
\begin{tabular}{|c|c|} \hline
\textbf{n\'umero de simulaci\'on} & \textbf{Tiempo Medio(m)}\\ \hline \hline
1 &336.39 \\ \hline
2 &188.94\\ \hline
3 &214.17\\ \hline
4 &331.63\\ \hline
5 &140.16\\ \hline
6 &284.71\\ \hline
7 &217.73\\ \hline
8 &323.68\\ \hline
9 &309.88\\ \hline
10 &237.44\\ \hline
\end{tabular}
\end{table}

\section*{Parte F}
\textbf{Si la probabilidad de que la caja C3 est\'e operativa es p, computar el tiempo medio por
cliente en el sistema en funci\'on de p. Graficar}\\


En la figura \ref{fig:qcajaP} mostramos el tiempo medio por cliente en el sistema 
para distintos valores de probabilidad $p$ de que la caja C3 est\'e activa. 
Apreciamos que la performance del sistema no se ve afectada por el estado 
(operativo o no) de la caja 3 ya que no se observa que a mayor valor de $p$
 incremente el tiempo medio por cliente.  Este hecho es razonable dado que 
 la estaci\'on E2 que precede a las cajas posee un tiempo de atenci\'on 
 mayor al de las cajas.

\begin{figure}[ht]
 	\centering
 		\includegraphics[width=0.49\textwidth]{graphics/puntoF_sin_semilla.pdf}
 	\caption{\protect\small Tiempo medio de espera de un cliente en la cola para 
	un modelo donde una caja se encuentra operativa con probabilidad p}
 	\label{fig:qcajaP}
\end{figure}
\section*{Parte G}
\textbf{Computar la probabilidad de que el tiempo medio de espera en la cola de OFT sea mayor
a 5 minutos.}\\


Para calcular la probabilidad de que el tiempo medio de espera en la cola de OFT 
sea mayor a 5 minutos simulamos muchas veces el sistema utilizando como 
criterio de corte la diferencia entre varianzas sucesivas. 
Cuando es menor a un error de $1.0 \times 10^{-6}$ dejamos de simular y calculamos el 
promedio de las probabilidad calculada para cada simulacion. El valor obtenido luego de 
$616$ iteraciones con una signficancia de $ 5\% $ es $0.70728 \pm 0.0154005$.


%FIJATE SI SABES COMO PONER EL EXPONENCIAL.. LO PUSE CON E PERO NO SE SI ES ASI.. ARRIBA Y ABAJO HAY DOS CON ESO..

%~ \begin{itemize}
 %~ \item Cantidad de iteraciones para criterio de detencion $1E-06: 616$
 %~ \item Estimacion del par\'ametro: 0.70728
 %~ \item Semiamplitud del intervalo de confianza para $\alpha = 0.05: 0.0154005$
%~ \end{itemize}

\nocite{Diaz2009, Lips2000, Sco1979, Hyn1995, Ash2000}
\bibliographystyle{abbrv}
\bibliography{ss-tp-final}
\end{document}
